97 research outputs found

    Language Models for Handwritten Short Message Services

    Get PDF
    International audienceHandwriting is an alternative method for entering texts composing Short Message Services. However, a whole new language features the texts which are produced. They include for instance abbreviations and other consonantal writing which sprung up for time saving and fashion. We have collected and processed a significant number of such handwriting SMS, and used various strategies to tackle this challenging area of handwriting recognition. We proposed to study more specifically three different phenomena: consonant skeleton, rebus, and phonetic writing. For each of them, we compare the rough results produced by a standard recognition system with those obtained when using a specific language model

    On-line hand-drawn electric circuit diagram recognition using 2D dynamic programming

    Get PDF
    9 pagesInternational audienceIn order to facilitate sketch recognition, most online existing works assume that people will not start to draw a new symbol before the current one has been finished. We propose in this paper a method that relaxes this constraint. The proposed methodology relies on a two-dimensional dynamic programming (2D-DP) technique allowing symbol hypothesis generation, which can correctly segment and recognize interspersed symbols. In addition, as discriminative classifiers usually have limited capability to reject outliers, some domain specific knowledge is included to circumvent those errors due to untrained patterns corresponding to erroneous segmentation hypotheses. With a point-level measurement, the experiment shows that the proposed novel approach is able to achieve an accuracy of more than 90 percent

    Language Independent Statistical Models for on-Line Handwriting Recognition

    Get PDF
    http://www.suvisoft.comThis paper deals with a language modeling approach that is dedicated to an on-line handwriting recognition system. Three main goals are set: i) performances, ii) versatility, and iii) resources. To achieve these goals we propose a statistical word n-class approach, which uses a learning stage to cluster words in classes and defines an estimation of the probability distribution of sequences of classes. Very large corpora from three different languages (English, French and Italian) have been used to train and test the language models. The efficiency of these models are evaluated not only from a linguistic point of view, using perplexity measurements, but also combined inside the recognition system on real ink signals corresponding to written sentences. Using a tri-class model allows a word error rate reduction ranging from to 50 to 60% according to the language

    Fusion de résultats en recherche d'information : application aux documents manuscrits en-ligne

    Get PDF
    Ce travail présente les résultats d'une étude sur la combinaison des deux approches majeures existantes pour la recherche de documents manuscrits en-ligne. La première approche consiste à appliquer des méthodes de recherche d'information (RI) aux documents issus d'un processus de reconnaissance. La deuxième, quant à elle, ne nécessite pas de reconnaissance explicite et utilise un algorithme de word spotting. La fusion permet d'améliorer les performances de la recherche. Les résultats montrent que pour des textes ayant un taux d'erreur au niveau mot inférieur à 23 %, les performances après fusion sont comparables à celles obtenues avec la vérité terrain. De plus, pour des textes fortement dégradés, des améliorations sont également observées

    Apprentissage de relations spatiales pour la reconnaissance d'expressions mathématiques manuscrites en-ligne

    Get PDF
    International audienceNous proposons dans cet article une nouvelle méthode d'analyse syntaxique et structurelle pour un système de reconnaissance d'expressions mathématiques manuscrites enligne. Une grammaire probabiliste est mise en place pour regrouper les hypothèses de segmentation/reconnaissance proposées par un segmenteur 2D. Les probabilités associés à la grammaire sont calculées à partir d'informations structurelles entre les symboles. Ces informations structurelles utilisent l'évaluation d'une relation spatiale entre les éléments intervenants dans chaque règle. L'apprentissage du système se fait en deux phases, d'abord l'apprentissage global du classifieur sans tenir compte de la grammaire, puis l'apprentissage des relations spatiales intervenant dans la grammaire. Ce système est entraîné et testé sur une large base synthétisée d'expressions, puis testé sur une base d'expressions réelles complexes

    Reconstruction de la chronologie d'un tracé manuscrit hors-ligne

    Get PDF
    La reconnaissance de l'écriture manuscrite non contrainte reste confrontée à des problèmes très difficiles. Cependant, les méthodes de reconnaissance «en-ligne» présentent des résultats meilleurs que les approches «hors-ligne» qui perdent toute information temporelle. L'objectif du travail présenté ici est de restaurer l'ordonnancement des éléments du tracé à partir d'images statiques 2-D, information qui est directement disponible dans les systèmes en-ligne. L'approche présentée ici est innovante, premièrement, contrairement à la plupart des autres méthodes, elle utilise au maximum l'information niveaux de gris, deuxièmement, elle utilise une approche par filtrage dans la prédiction de la trajectoire d'un élément du tracé

    Une distance entre deux ensembles de séquences avec la contrainte de continuité

    Get PDF
    National audienceL'algorithme DTW (Dynamic Time Warping) est très largement utilisé pour calculer une distance entre des données en-ligne. Il permet une mise en correspondance point à point en respectant des contraintes de séquentialité pendant l'alignement entre les deux séquences correspondant aux tracés. Toutefois lorsque le tracé se présente sous la forme d'un nombre variable de traits pour lesquels le sens de chaque trait n'est pas imposé alors cet algorithme n'est plus directement utilisable. À l'inverse la distance de Hausdorff fait fi de l'ordre des points dans la séquence mais aussi de la continuité des points à l'intérieur d'un même trait, et est très sensible aux points excentrés (outliers). Dans ce papier, nous discutons de l'alignement entre deux ensembles de séquences de points avec contrainte de continuité intra-séquence, et nous proposons une mesure de distance découlant de cet alignement
    • …
    corecore